Google Gemini

Gemini
Generalized Multimodal Intelligence Network
Description de l'image Google Gemini logo.svg.

Informations
Créateur Google
Développé par Google Brain et DeepMind
Première version 7 décembre 2023[1]
État du projet officiellement lancé le 7 décembre 2023[1], et encore en développement
Type Famille de grands modèles de langage (d)Voir et modifier les données sur Wikidata
Licence Licence propriétaireVoir et modifier les données sur Wikidata
Site web deepmind.google/technologies/geminiVoir et modifier les données sur Wikidata

Google Gemini est une intelligence artificielle (IA), générative et multimodale, de type transformeur, créée par Google, annoncée lors de la conférence I/O destinée aux développeurs en juin 2023, puis présentée au public le 7 décembre 2023. Gemini signifie ici Generalized Multimodal Intelligence Network.

Ce grand modèle de langage (LLM) a été formé sur un ensemble massif de données de texte et d'images, entraîné sur les Tensor Processing Units (TPU) de Google.

Gemini peut comprendre et interagir avec l'audio et la vidéo, et générer du texte (poésie, scripts, pièces musicales, courriels, lettres, etc.), du code, des traductions (entre plus de 100 langues). Il peut produire plusieurs types de contenu créatif (images, dessins, sons, musique, vidéos...), aider des chercheurs en analysant des données ou en générant des hypothèses. Gemini peut répondre aux questions de manière informative ou en produisant des cours personnalisés, des jeux, des tutoriels..., avec les limites des IA (erreurs, biais, « hallucinations »...).

Selon Demis Hassabis, Gemini doit peu à peu pouvoir se connecter à des éléments robotiques, être doté d'un sens du toucher et de capacités à agir sur des actionneurs, tout en devenant plus précis et plus conscient du contexte et du monde[1].

  1. a b et c Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées BigData12Dec2023

Developed by StudentB